Clustering topologique pour le flux de données
نویسندگان
چکیده
Résumé. Actuellement, le clustering de flux de données devient le moyen le plus efficace pour partitionner un très grand ensemble de données. Dans cet article, nous présentons une nouvelle approche topologique, appelée G-Stream, pour le clustering de flux de données évolutives. La méthode proposée est une extension de l’algorithme GNG (Growing Neural Gas) pour gérer le flux de données. G-Stream permet de découvrir de manière incrémentale des clusters de formes arbitraires en ne faisant qu’une seule passe sur les données. Les performances de l’algorithme proposé sont évaluées à la fois sur des données synthétiques et réelles.
منابع مشابه
Nouvelle approche de bi-partitionnement topologique
Résumé. Dans ce papier, nous proposons une nouvelle approche topologique de bi-partitionnement (bi-clustering) appelée BiTM en utilisant les cartes autoorganisatrices. L’idée principale de l’approche est d’utiliser une seule carte pour le partitionnement simultané des lignes (observations) et des colonnes (variables). Contrairement aux approches utilisant les cartes topologiques, notre modèle n...
متن کاملTransformation de l'espace de description pour l'apprentissage par transfert
Dans ce papier, nous proposons une étude sur l’utilisation de l’apprentissage topologique pondéré et les méthodes de factorisation matricielle pour transformer l’espace de représentation d’un jeu de données "sparse" afin d’augmenter la qualité de l’apprentissage, et de l’adapter au cas de l’apprentissage par transfert. La factorisation matricielle nous permet de trouver des variables latentes e...
متن کاملChoix d'une mesure de proximité discriminante dans un contexte topologique
Résumé. Les résultats de toute opération de classification ou de classement d’objets dépendent fortement de la mesure de proximité choisie. L’utilisateur est amené à choisir une mesure parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence topologique choisie, certaines sont plus ou moins équivalentes. Dans cet article, nous proposons une nouvelle approche de co...
متن کاملModèles de mélanges topologiques pour la classification de données catégorielles et mixtes
Résumé. Cet article présente une méthode basée sur les cartes auto-organisatrices probabilistes dédiées à la classification non supervisée et la visualisation de données catégorielles et des données mixtes contenant des composantes quantitatives et binaires. Pour chacun de ces types de données, nous proposons un formalisme probabiliste dans lequel les unités de la carte topologique sont représe...
متن کاملClassification relationnelle topographique
Résumé : Ce papier présente un formalisme relationnel pour la classification topographique de données qualitatives (ou catégorielles), se présentant sous forme d’une matrice binaire ou d’une somme de matrices binaires. L’algorithme de la classification relationnelle topographique proposé s’inspire du modèle de Kohonen (conservation de l’ordre topologique) et utilise le formalisme de l’Analyse R...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2015